Wpływ cech czerwonego wina na jego jakość - wyjaśnienia globalne

Jakub Kosterna, Jan Smoleń, Bartosz Siński

Wczytanie modeli i zbioru danych

Przygotowanie explainerów

Permutacyjna ważność zmiennych dla wybranego przez nas modelu XGBoost.

Najważniejsze spostrzeżenia:

Uśrednione wartośći SHAP

Kolejność najważniejszych zmiennych w obu metodach jest prawie identyczna z wyjątkiem całkowitej zawartości dwutlenku siarki (total sulfur dioxide) i wartości kwasowości lotnej (volatile acidity). Zawartość alkoholu i siarczynów w uśrednionych wartosciach SHAP także mniej odstaje od reszty zmiennych.

Porównanie permutacyjnej ważności zmiennych między różnymi modelami.

Wnioski:

SVM po standaryzacji

Standaryzacja prawie nie zmieniła kolejności najważniejszych zmiennych, jednak wyrównała wartośći dla mniej ważnych zmiennych.

PDP dla XGBoost

Porównanie profili PDP dla różnych modeli

Wnioski:

ALE i PDP dla wybranego przez nas modelu

Porównanie profili ALE dla różnych modeli

Najważniejsze spostrzeżenia:

Wnioski ogólne